이산 확률 변수에서 연속 확률 변수로의 전환은 관점의 거대한 변화를 의미합니다: 개별 '질량 점'을 더하는 방식에서 밀도 곡선 아래의 매끄러운 '면적'을 측정하는 방식으로 바뀌는 것입니다. 이산 변수는 세어지는 가능한 결과를 다루는 반면, 연속 변수는 시간, 거리, 무게와 같은 현실 세계의 무한한 세밀함을 모델링합니다.
핵심 전환: 합에서 적분으로
확률 변수 $X$가 연속적이라면, 음이 아닌 함수 $f$가 존재하여 이를 확률 밀도 함수 (PDF) $X$의 것으로, 임의의 실수 집합 $B$에 대해 다음이 성립합니다:
$P\{X \in B\} = \int_B f(x) dx$
중요하게도, 이는 임의의 특정 값 $a$에 대해 $P(X = a) = \int_a^a f(x) dx = 0$임을 의미합니다. 연속적인 영역에서는 구간 위에서만 확률을 논할 수 있습니다.
PDF와 누적 분포 함수의 상호작용
누적 분포 함수 (CDF) $F(x)$는 $-\infty$부터 $x$까지의 확률을 누적하는 역할을 합니다:
관계식
$F(x) = P\{X \le x\} = \int_{-\infty}^{x} f(t) dt$
미분
적분 기본 정리에 따르면, 밀도는 확률이 누적되는 비율입니다: $\frac{d}{dx}F(x) = f(x)$
중앙 경향성 측정법
- 기대값: $E[X] = \int_{-\infty}^{\infty} xf(x) dx$
- 중앙값 ($m$): 면적을 반으로 나누는 점으로, $F(m) = \frac{1}{2}$인 점입니다.
- 최빈값: $f(x)$가 최댓값에 도달하는 $x$의 값입니다.
합의 한계
우리 여정 속의 '적분'을 이해하려면, 이산 세계—예를 들어 레그랑주 정리 ($\sum_{k=1}^{\infty} 1/k^2 = \pi^2/6$) 또는 약수에 대한 복잡한 논리(여기서 $D=k$일 경우 $k$는 $X$와 $Y$ 모두를 나누고, $X/k$, $Y/k$는 서로소여야 함)—과 연속 세계를 비교하세요. 여기서 우리는 분산을 $Var(X) = E[(X - E[X])^2]$로 계산하고, 함수의 기대값을 $E[g(X)] = \int_{-\infty}^{\infty} g(x)f(x) dx$를 통해 계산합니다.
🎯 핵심 통찰
기대값은 누적 분포 함수와 수평선 $y=0$, $y=1$ 사이의 면적이라고도 볼 수 있습니다. 임의의 확률 변수 $Y$에 대해:
$E[Y] = \int_{0}^{\infty} P\{Y > y\} dy - \int_{0}^{\infty} P\{Y < -y\} dy$